MINED BITEXTS可以包含不完美的翻译,从而产生神经机翻译(NMT)的不可靠的训练信号。在已知过滤这样的对以提高最终模型质量的情况下,我们认为它在低资源条件下是次优的,甚至开采数据可以限制。在我们的工作中,我们提出了通过自动编辑来改进挖掘的BIESTS:给出语言XF中的句子,而且可能是IT XE的不完美翻译,我们的模型生成了一个修订的版本XF'或XE',产生更等值翻译对(即<XF,XE'或<XF',XE>)。我们使用一个简单的编辑策略(1)挖掘在给定的BITExt中的每个句子的潜在不完美的翻译,(2)学习一个模型来重建原始翻译并以多任务方式翻译。实验表明,我们的方法在大多数情况下,在大多数情况下,我们的方法成功地提高了5个低资源语言对和10个翻译方向,在大多数情况下改善了竞争反播基线。
translated by 谷歌翻译